闲话 22.12.16

闲话

字符串能不能滚出 OI 啊?😅

所以今天写点小清新的杜教筛。
凭借已经做过 6/9 的历史,我成功在一晚上切穿了杜教筛专题,快来膜我!

昨天闲话里发生了很奇妙的事情
我不知道为什么
这里 @ 一下 jjdw 是有意义的吧(

杜教筛

发现自己还没写过杜教筛的内容,那就权当帮同学预习吧(

首先这玩意的前置知识是 Dirichlet 卷积,记这个复合为 ,正常的点值乘法为 ×。其实推导式子是不用莫反的。

假设我们有一个积性函数 f,定义它的前缀和函数为 S(f,n)=i=1nf(i)。现在需要解决的是快速算出 S(f,n)。由 duls 总结的杜教筛对一部分具有特殊性质的 f 提供了一种 O(n2/3) 时间复杂度的解决方案。

具体地,我们构造 g,h s.t. h=fg。假设我们容易对给定的多个 kn s.t. x,k=nx 求得 S(g,k)S(h,k),我们就可以应用杜教筛。杜教筛的推导如下:

S(h,n)=x=1nh(x)=x=1nd|xg(d)f(xd)=d=1ng(d)x=1ndf(x)=d=1ng(d)S(f,nd)=g(1)S(f,n)+d=2ng(d)S(f,nd)g(1)S(f,n)=S(h,n)d=2ng(d)S(f,nd)S(f,n)=1g(1)(S(h,n)d=2ng(d)S(f,nd))

所以就可以按照上面的方式递归了!(一般 g(1)1 所以可以忽略)

那复杂度是多少呢?应用分析 Min25 筛时用到的渐进方式可以得到

i=1nO(i)+i=1nO(ni)= O(1nx12dx)+O(1n(nx)12dx)= O(n3/4)+O(n3/4)

因此不预处理的复杂度是 O(n3/4) 的。这里默认记忆化了。

欸你刚才不是说 2/3 吗?咋变慢了?
别着急,现在考虑预处理。我们预处理前 B 个位置的值,且有 Bn,复杂度就变成了

i=BnO(ni)=O(nB)

B=n2/3 得到总时间复杂度 O(n2/3)

总结一下,杜教筛是一类特殊的递归方案。我们首先选取两个易求前缀和的函数,随后将所求函数 f 的前 n2/3 个点值求出来,做前缀和,最后记忆化递归,在过程中模拟如上的式子就能得到最终答案了。
还发现,由于杜教筛的记忆化性质,其可以在一次求解中得到 n 对应 O(n) 个数论分块点值处的前缀和。因此其时间复杂度应当均摊分析,用于数论分块中时总复杂度没有退化。
重复式子:构造 g,h s.t. h=fg

S(f,n)=1g(1)(S(h,n)d=2ng(d)S(f,nd))

给出几个常见的数论函数:

  • 欧拉函数 φ(n)=(d,n)=11
  • 莫比乌斯函数 μ(n)
  • 恒等函数 I(n)=1
  • 元函数 e(n)=[n=1]
  • 单位函数 id(n)=n
  • 约数个数函数 d(n)=d|n1
  • 题面里给的函数 f(n)=

这里记 k 个数论函数 f 卷起来的函数为 fk

给出几个常见的构造:

  • μI=e  f=(fI)μ  该变换即莫比乌斯反演。
  • φI=id  idμ=φ
  • idid=id×d

结合例题来理解吧。

例题

首先是板子。

【模板】杜教筛

给定正整数 n,求 S(φ,n)S(μ,n)

n1011

照上式模拟即可。具体看代码。

code
#include <bits/stdc++.h>
using namespace std;
#define int long long
#define rep(i,a,b) for ( register int (i) = (a); (i) <= (b); ++(i) )
#define pre(i,a,b) for ( register int (i) = (a); (i) >= (b); --(i) )
using namespace std;
const int N = 5e6 + 10, L = 5e6;
int T, n;

int prime[N], cnt, phi[N], mu[N];
inline void sieve() {
    phi[1] = mu[1] = 1;
    rep(i,2,L) {
        if (phi[i] == 0) prime[++cnt] = i, phi[i] = i - 1, mu[i] = - 1;
        rep(j,1,cnt) {
            int tmp = i * prime[j];
            if (tmp > L) break;
            if (i % prime[j] == 0) {
                phi[tmp] = prime[j] * phi[i]; mu[tmp] = 0;
                break;
            } else 
                phi[tmp] = phi[prime[j]] * phi[i]; mu[tmp] = -mu[i];
        }
    } 
	rep(i,2,L) phi[i] = phi[i-1] + phi[i], mu[i] = mu[i-1] + mu[i];
}

int _phi[N], _mu[N];
inline int getPhi(int x) {
	if (x <= L) return phi[x];
	if (~_phi[n / x]) return _phi[n / x];
	int ret = 1ll * x * (x + 1) >> 1;
	for (int l = 2, r; l <= x; l = r+1) {
		r = x / ( x / l );
		ret -= (r - l + 1) * getPhi(x / l);
	} 
	return _phi[n / x] = ret;
}

inline int getMu(int x) {
	if (x <= L) return mu[x];
	if (~_mu[n / x]) return _mu[n / x];
	int ret = 1;
	for (int l = 2, r; l <= x; l = r + 1) {
		r = x / ( x / l );
		ret -= (r - l + 1) * getMu(x / l);
	} 
	return _mu[n / x] = ret;
}

signed main() {
	sieve(); cin >> T;
	while (T--) {
		cin >> n;
		memset(_phi, -1, sizeof _phi);
		memset(_mu, -1, sizeof _mu);
		cout << getPhi(n) << ' ' << getMu(n) << '\n';
	} 
}



简单的最大公约数

给定 n,k,求

a1=1ka2=1ka3=1kan=1kgcd(a1,a2,a3,,an)(mod1000000007)

n,k1011

这里是早就写好了的题解



DZY Loves Math IV

给定 n,m,求

i=1nj=1mφ(ij)(mod1000000007)

n105,m109

考虑 n 比较小,我们可以对每个 n 计算答案后求和。

现在的问题是求解

S(n,m)=i=1mφ(in)

假设 n=pq,其中 p 是将 n 的所有质因子拿出一个来求积的得数。我们有

S(n,m) =i=1mφ(in) =qi=1mφ(ip) =qi=1mφ(pgcd(i,p))φ(i)gcd(i,p) =qi=1mφ(pgcd(i,p))φ(i)d|(i,p)φ(d)(φI=id) =qi=1mφ(i)d|(i,p)φ(dpgcd(i,p))(φ) =qi=1mφ(i)d|(i,p)φ(pd) =qd|pφ(pd)i=1m/dφ(id) =qd|pφ(pd)S(d,md)

递归计算即可。边界不再赘述。

由于最终是 md 的形式,所以第二维的取值数是 O(nm) 的。每一层要枚举的总状态数是O(n) 的,因此这一部分的复杂度是 O(n(n+m))。考虑杜教筛的记忆化形式,边界本质上只需要进行一次杜教筛即可全部求出来。因此总时间复杂度为 O(n(n+m)+m2/3)
理论复杂度能跑 1011,本机 O2 加持下跑了 1.61s。

Submission



神犇和蒟蒻

给定 n,m,求

i=1nμ(i2)i=1nφ(i2)

n109

没啥,放这题就是整点水清凉一下(

μ 那个显然答案就是 1
φ……哦想起来了,放这题是因为想告诉你们 φ(nk)=nk1φ(n)。挺好用的。

f(n)=φ(n)×nfid=id2。剩下的看代码。

Submission



Lucas的数论

给定 n,求

i=1nj=1nd(ij)(mod1000000007)

n109

还记得 约数个数和 那题吗?
直接套那个式子

i=1nj=1nd(ij)= i=1nj=1nx|iy|j[gcd(x,y)=1]= i=1nj=1nx|iy|jd|(x,y)μ(d)= x=1y=1d|(x,y)μ(d)nxny= d=1μ(d)x=1nxdy=1nyd

然后对 d 进行数论分块,对 μ 采用杜教筛,对 x,y 采用二次数论分块。

根据杨卓凡第一小定理(?)可知总时间复杂度为 O(n3/4)

Submission


留着别的题明天写吧。


upd: 对杜教筛的巨大常数优化:非递归

模板题实现

Submission.

#include <bits/stdc++.h>
using namespace std;
#define inline __attribute__((__gnu_inline__, __always_inline__, __artificial__)) inline
using pii = pair<int,int>; using vi = vector<int>; using vp = vector<pii>; using ll = long long; 
using ull = unsigned long long; using db = double; using ld = long double; using lll = __int128_t;
template<typename T1, typename T2> T1 max(T1 a, T2 b) { return a > b ? a : b; }
template<typename T1, typename T2> T1 min(T1 a, T2 b) { return a < b ? a : b; }
#define multi int _T_; cin >> _T_; for (int TestNo = 1; TestNo <= _T_; ++ TestNo)
#define timer cerr << 1. * clock() / CLOCKS_PER_SEC << '\n';
#define iot ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
#define file(x) freopen(#x".in", "r", stdin), freopen(#x".out", "w", stdout)
#define rep(i,s,t) for (register int i = (s), i##_ = (t) + 1; i < i##_; ++ i)
#define pre(i,s,t) for (register int i = (s), i##_ = (t) - 1; i > i##_; -- i)
#define eb emplace_back
#define pb pop_back
const int N = 4e6 + 10;
const int inf = 0x3f3f3f3f;
const ll infll = 0x3f3f3f3f3f3f3f3fll;
ll n, th, mp[N], lp[N], ilp[N], lv[N], cntl;
ll phimp[N], mump[N];
int T[N], cT;
db iv[N];

ll phi[N], mu[N], pri[N], cntp;
void sieve(int N) {
    phi[1] = mu[1] = 1;
    rep(i,2,N) {
        if (!phi[i]) pri[++ cntp] = i, phi[i] = i - 1, mu[i] = -1;
        rep(j,1,cntp) {
            if (i * pri[j] > N) break;
            if (i % pri[j] == 0) {
                phi[i * pri[j]] = phi[i] * pri[j], mu[i * pri[j]] = 0;
                break;
            } else {
                phi[i * pri[j]] = phi[i] * (pri[j] - 1), mu[i * pri[j]] = - mu[i];
            }
        }
    }
    rep(i,1,N) phi[i] += phi[i - 1], mu[i] += mu[i - 1];
}

#define Sid(n) (1ll * (n) * ((n) + 1) / 2)
#define SI(n) (n)
#define Se(n) (1)

signed main() {
    cin >> cT;
    rep(i,1,cT) cin >> T[i], n = max(n, T[i]);
    th = min(N - 5, (int)pow(n, 2./3));
    sieve(th);
    rep(i,1,(int)sqrt(n)) iv[i] = 1. / i;
    // cerr << (ll)(1e10) / 10000 << ' ' << iv[10000] << ' ' << (int)((ll)(1e10) * iv[10000]) << endl;
    rep(i,1,cT) {
        n = T[i];
        if (n <= th) {
            cout << phi[n] << ' ' << mu[n] << '\n';
            continue;
        }
        cntl = 0;
        for (ll l = 1, r; n / l > th; l = r + 1) {
            r = n / (n / l);
            mp[lp[++ cntl] = l] = n / l;
            rep(i,l,r) lv[i] = l;
        }
        pre(i,cntl,1) {
            ll nc = mp[lp[i]], sqnc = (int)sqrt(nc);
            phimp[i] = Sid(nc) + 1ll * SI(sqnc) * phi[sqnc];
            mump[i] = Se(nc) + 1ll * SI(sqnc) * mu[sqnc];
            rep(j,1,sqnc) {
                int it = int(nc * iv[j] + 1e-8); // 警钟敲烂:如果 nc mod j = 0 则需要 + eps 防丢精
                phimp[i] -= 1ll * (phi[j] - phi[j - 1]) * SI(it);
                mump[i] -= 1ll * (mu[j] - mu[j - 1]) * SI(it);
                if (j > 1) if (it <= th) {
                    phimp[i] -= phi[it];
                    mump[i] -= mu[it];
                } else {
                    phimp[i] -= phimp[lv[lp[i] * j]];
                    mump[i] -= mump[lv[lp[i] * j]];
                }
            }
            // cerr << "Partial answer : " << nc << ' ' << sqnc << ' ' << phimp[i] << ' ' << mump[i] << endl;
        } 

        cout << phimp[1] << ' ' << mump[1] << '\n';
    }
}
posted @   joke3579  阅读(168)  评论(1编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示